最近,将音频转换为文本的系统自动语音识别(ASR)在机器学习社区中引起了很多关注。因此,Huggingface发布了许多公开模型。但是,这些ASR模型中的大多数都有英文提供。泰语中只有少数模型可用。此外,大多数泰国ASR型号都是封闭的,现有开源模型的性能缺乏稳健性。为了解决这个问题,我们使用泰语CommonVoice Corpus V8培训了一种新的ASR模型,并在预训练的XLSR-WAV2VEC模型上训练ASR模型,并训练Trigram语言模型以提高我们的ASR模型的性能。我们希望我们的模型对泰国的个人和ASR社区有益。
translated by 谷歌翻译
$ \ mathbf {perive} $:使用人工智能(AI)到:(1)从相对较大的人群中利用视神经头(ONH)的生物力学知识; (2)评估ONH的单个光学相干断层扫描(OCT)扫描的稳健性; (3)确定哪些关键的三维(3D)结构特征使给定的ONH稳健。 $ \ Mathbf {Design} $:回顾性横断面研究。 $ \ mathbf {Methods} $:316个受试者通过Ophthalmo-Dynamometry在急性眼内和之后与OCT成像。然后将IOP诱导的椎板胶状变形映射为3D,并用于对ONH进行分类。 LC变形高于4%的人被认为是脆弱的,而变形较低的人则较低4%。从这些数据中学习,我们比较了三种AI算法,以严格地从基线(未呈现的)OCT卷中预测鲁棒性:(1)随机森林分类器; (2)自动编码器; (3)动态图CNN(DGCNN)。后一种算法还使我们能够确定哪些关键的3D结构特征使给定的智能稳定。 $ \ mathbf {结果} $:所有3种方法都能够单独预测3D结构信息的稳健性,而无需执行生物力学测试。 DGCNN(接收器操作曲线下的区域[AUC]:0.76 $ \ pm $ 0.08)的表现优于自动编码器(AUC:0.70 $ \ pm $ 0.07)和随机森林分类器(AUC:0.69 $ \ pm $ 0.05)。有趣的是,为了评估稳健性,DGCNN主要使用了巩膜和LC插入部位的信息。 $ \ mathbf {结论} $:我们提出了一种AI驱动的方法,可以仅从ONH的单个OCT扫描中评估给定ONH的稳健性,而无需进行生物力学测试。纵向研究应确定ONH鲁棒性是否可以帮助我们确定快速的视野损失进展者。
translated by 谷歌翻译
目的:评估中央视网膜血管躯干及其分支(CRVT&B)的三维(3D)结构构型是否可用作青光眼的诊断标志物。方法:我们训练了深度学习网络,从光神经头(ONH)的光学相干断层扫描(OCT)体积的B-Scans自动分割CRVT&B。随后,使用从OCT体积中提取的CRVT&B的结构构型,两种不同的方法用于青光眼诊断。在第一种方法中,我们旨在仅使用CNN的3D CNN和CRVT&B的3D结构提供诊断。对于第二种方法,我们将CRVT&B的3D结构投射到三个平面上以获得2D图像,然后使用2D CNN进行诊断。使用骰子系数评估分割精度,而使用接收器操作特性曲线(AUC)下的区域评估诊断准确度。 CRVT&B的诊断性能也与视网膜神经纤维层(RNFL)厚度进行了比较。结果:我们的分割网络能够从OCT扫描有效地分段视网膜血管。在测试集上,我们实现了0.81 \ PM0.07的骰子系数。 3D和2D诊断网络能够将青光眼与非青光眼受试者区分别分别区分82.7%和83.3%的精度。 CRVT&B的相应AUC为0.89和0.90,高于用RNFL厚度获得的0.90℃。结论:我们的工作表明,CRVT&B的诊断功能优于金标 - 标准的青光眼参数,即RNFL厚度。我们的作品还建议主要视网膜血管形成骨架 - 其配置可以代表主要的ONH结构变化,通常观察到青光眼的开发和进展。
translated by 谷歌翻译